Pearson's Chi-squared test
data: contingency_table
X-squared = 38.807, df = 4, p-value = 7.637e-08
El deterioro cognitivo leve (DCL) es una condición en la que las personas experimentan una disminución en sus habilidades cognitivas mayor a la esperada para su edad, sin que esto interfiera significativamente con su vida diaria. Aunque el DCL puede mantenerse estable durante años, es una señal de alerta porque puede progresar a enfermedades más graves, como la enfermedad de Alzheimer. El Alzheimer es la causa más común de demencia, se caracteriza por la acumulación de proteínas anormales en el cerebro, que dañan las neuronas y causan pérdida de memoria y otras capacidades cognitivas avanzadas. Estos cambios comienzan mucho antes de que los síntomas sean evidentes, por lo que la detección temprana es crucial.
Para nuestra investigación, vamos a abordar las siguientes preguntas clave:
Para abordar este problema, primero realizaremos un análisis exploratorio de datos para entender mejor la distribución y las características de las variables disponibles. Posteriormente, utilizaremos un enfoque bayesiano en nuestro análisis para ajustar y comparar modelos para identificar las relaciones entre variables morfológicas del cerebro, características demográficas y el riesgo de desarrollar DCL o Alzheimer. Al evaluar la importancia de cada variable en la predicción de estas condiciones, podremos seleccionar el mejor modelo que represente los datos y las relaciones de manera más precisa. Nuestro objetivo final es mejorar nuestra comprensión de los factores que contribuyen al desarrollo de enfermedades neurodegenerativas.
Utilizamos el conjunto de datos llamado cerebros.csv. Este conjunto incluye información de 128 pacientes que se sometieron a estudios de resonancia magnética en diferentes partes del mundo. Las variables en este conjunto de datos son:
id: Identificación del paciente.
intensidad_campo: Intensidad del campo magnético utilizado en la imagen (puede ser 3 T o 1.5 T). Sabemos que a mayor intensidad, se obtiene información más detallada de los pacientes.
resonador_fab: Marca del resonador (Phillips, Siemens, General Electric).
edad: Edad del paciente (en años).
sexo: Sexo del paciente.
diag: Diagnóstico, que puede ser HC (control sano), MCI (deterioro cognitivo leve) o AD (enfermedad de Alzheimer).
lh_subcx_hippocampus_volume: Es la medida del tamaño del hipocampo en el hemisferio izquierdo del cerebro (en mm³).
En primer instancia se realizo un auto EDA para elegir relaciones de interes y presentarlas con mayor profundidad. De alli surgió el interes en la variable/relaciones
\(H_0)\) Las dos variables categóricas son independientes. Esto significa que la distribución de una variable es la misma en todas las categorías de la otra variable.
\(H_1)\) Las dos variables categóricas no son independientes. Esto significa que la distribución de una variable es diferente en al menos una categoría de la otra variable.
Pearson's Chi-squared test
data: contingency_table
X-squared = 38.807, df = 4, p-value = 7.637e-08
Considerando que nuestro interes esta en explicar que variables muestran o dan indicio de predisposicion a desarrollar una enfermedad neurodegenerativa, analizaremos nuestra respuesta enfermedad como una variable binaria que toma el valor 1 si el paciente tiene una enfermedad, o 0 si su control resultó sano.
Modelaremos enfermedad como la respuesta de una regresión logística. Los modelos que nos ayudan a responder los objetivos son los siguientes.
\[Enfermedad_i | \pi_i \sim Bernoulli(\pi_i) \]
\[logit(\pi_i) = \beta_0 + \beta_1 . \text{Vol Hipocampo}_i + \beta_2 . \text{Espesor Corteza Sup Frontal}_i +\] \[+ \beta_3. \text{Vol Corteza Fusiforme}_i + \beta_4. \text{Vol Intracraneal}_i\]
\[Enfermedad_i | \pi_i \sim Bernoulli(\pi_i) \]
\[logit(\pi_i) = \beta_0 + \beta_1 . Edad_i + \beta_2 . Sexo_i\]